以多層感知器辨識情緒於國台客語料庫 (Use Multilayer Perceptron To Recognize Emotion in Mandarin, Taiwanese and Hakka Database) [In Chinese]
نویسندگان
چکیده
منابع مشابه
台灣情緒語料庫建置與辨識 (An Emotional Speech Database in Taiwan: Collection and Recognition) [In Chinese]
[1]這本小書開始了情感運算的時代,此書定義了情感運算,從一個資訊工程研究者的角 度來描述與說明情感運算的應用及重要性,解釋基本的訊號處理與機器學習分類的觀念。 情感運算為一個龐大的研究議題,其中橫跨多個領域如資訊科學、心理學、感知科學和 工程學等等。[2]對語音情緒辨識做了大略的概論,首先整理了研究中普遍常見的情緒語 料庫,探討基本特徵參數如音高(Pitch)、能量(Energy)、基頻(Fundamental Frequency, F0) 和梅爾倒頻譜係數(Mel Frequency Cepstral Coefficients, MFCC)等,後端則實驗高斯混合 模型(Gaussian Mixture Model, GMM)、支持向量機(Support Vector Machine, SVM)、隱藏 式馬可夫模型(Hidden Markov Model, HMM)和類神經網絡(A...
متن کامل結合非線性動態特徵之語音情緒辨識(Speech Emotion Recognition via Nonlinear Dynamical Features)[In Chinese]
本研究採用機器學習法對語音情緒辨識進行探討。除一般常被採用之語音特徵, 如音高、共振峰、能量以及梅爾倒頻譜係數之外,研究中加入了夏農熵和曲率指 標(curvature index)[9]兩項非線性特徵,再利用費雪鑑別比與基因演算法搭配的方 式進行特徵挑選。最後使用支持向量機分類器,對柏林語音情緒資料庫進行情緒 分類分析。在加入非線性特徵後,男性及女性之情緒辨識率分別為 88.89%及 86.21%。 Abstract This study is focus on speech emotion recognition through machine learning method. We add two nonlinear dynamical features: Shannon entropy and curvature index, of each frame other than ...
متن کامل多語聲學單位分類之最佳化研究 (The Study of Acoustic Model Clustering in Multilingual Speech Recognition) [In Chinese]
由於全球化的形成,人與人之間的溝通不再限於同一種語言,因此多語的語音辨識也變 的格外的重要。如何有效整合多語的聲學模型是一個關鍵議題,因為一組好的多語聲學 單位將影響辨識結果。本論文提出了一套整合專家背景知識與實際語音分析的方法,來 產生一組新的聲學單位,並且對這組聲學單位的數目,使用差分貝式資訊法則來做最佳 的處理。從訓練好的隱藏式馬可夫聲學模型中,計算其單位間的相似度矩陣,之後透過 語音學和音韻學的知識,限定了各個聲學單位能群化的上限,根據不同限定的群化上 限,使用聚合階層式分群法,來建立不同的結構樹。之後,利用差分貝式資訊法則,將 每個結構樹中發音相近的聲學單位做合併,當差分貝式資訊法則的值小於零的時候,就 停止合併,而新合併成一群的聲學單位則為新的聲學單。我們將用 ForSDAT01 華台雙語 語料庫來實驗評量,而實驗結果顯示,本論文所提出的新方法比只用專家知識所定義的 聲學...
متن کامل國語廣播新聞語料轉述系統之效能評估 (Evaluation of Mandarin Broadcast News Transcription System) [In Chinese]
在 1995 年世界四個做語音辨認研究的著名單位(BBN, CMU, Dragon 及 IBM)開始參與一個在 當年是一項創舉的語音辨認評比之語音資料庫建立工作,該語音資料庫稱做 Hub-4,在此項評比 中希望能做到廣播新聞語料自動轉述(automatic broadcast news transcription)[1]。Hub-4 語料庫中也 已陸續加入許多語料,事實上 Hub-4 語料庫中也已經有國語廣播新聞語料,其內容是由大陸中央 台及洛杉磯中文台的廣播新聞節目錄製而成。由 1999 年 DARPA 所舉辦的語音辨認評比的結果 可以看出世界各大語音辨認研究單位在廣播新聞語料自動轉述已獲得重大的進展;不只在語音辨 認方面,在 segmentation、information extraction、topic detection 等技術都有許多成果。在英文廣播 新聞語料語音辨認方面...
متن کامل利用聲學與文脈分析於多語語音辨識單元之產生 (Generation of Phonetic Units for Multilingual Speech Recognition Based on Acoustic and Contextual Analysis) [In Chinese]
摘要 由於全球化趨勢之盛行,多語語音常出現於會議紀錄及一般對話等方面。對於會議紀錄及對話系統而 言,多語語音自動辨識日顯重要。在多語語音自動辨識中,辨識單元集之定義及選取,將影響辨識之效率 及效能。本論文針對中英文利用 IPA 定義之多語語音辨識單元集,考慮前後文相關之三連音模型,並進一 步透過對聲學相似度與前後文脈分析,決定一組精簡有效的多語辨識單元。在相似度矩陣分析中,首先我 們利用事後機率統計,建立聲學相似度矩陣,然後,基於發音共聲現象的考量,分析語音發音上之相似度。 本論文更引入語言超空間相似度之觀念,計算三連音辨識單元前後文脈之關係,建立語言超空間相似度矩 陣。最後利用資料融合技術,合併聲學相似度矩陣和語言超空間相似度矩陣,以計算三連音辨識單元間之 距離,而後利用向量量化群集方法合併相似性高之三連音辨識單元,建立一個有效的多語語音辨識單元 集。本論文以 EAT 中英雙語語料...
متن کامل